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摘要 : [目的 /意义 ] 大 数据 时 代 给 传统 知识 管理 带 来 了 变革 ,为 适应 大 数据 时 代 的 到 来 ,需要 重新 认识 和 
定位 知识 管理 过 程 ,应 用 大 数据 技术 工具 构建 新 的 知识 管理 模型 ,以 应 对 知识 管理 的 更 新 与 挑战 。[ 方法 /过 
程 ] 通过 梳理 数据 到 知识 的 形成 过 程 ,结合 大 数据 的 4V 特征 ,了 解 知识 管理 所 需 的 大 数据 技术 工具 ,并 将 大 数 
据 时 代 的 知识 管理 划分 为 知识 生产 、 知 识 积累 、 知 识 交 流 、 知 识 应 用 4 个 阶段 ,结合 大 数据 技术 工具 的 使 用 , 构 
建新 的 知识 管理 模型 ,提出 应 对 碎片 整合 、 应 用 价值 硬件 支撑 、 隐 私 伦理 等 问题 的 对 策 。[ 结果 /结论 ] 大 数据 
的 发 展 推动 了 知识 管理 过 程 从 传统 模型 向 技术 模型 的 转型 ,大 数据 时 代 的 知识 管理 模型 与 大 数据 技术 的 使 用 
紧密 相关 ,强调 从 海量 碎片 化 数据 中 提炼 知识 价值 ,并 更 有 效 地 辅助 组 织 决策 ,为 此 ,需要 做 好 硬件 设施 支撑 和 
信息 安全 保障 ,将 大 数据 技术 与 小 样本 分 析 相 结合 ,推动 知识 管理 走向 新 的 层次 。 
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tion ,合法 化 validity 有效 性 validity ) 。 

人 伴随 着 互联 网 技术 及 计算 机 科学 的 发 展 ,几乎 所 

放 名。 AU 直 有 了 ET 有 证 二 媒体 的 收 球 必 展 十 
斌 商务 、 司 物 联 以 及 社交 近 体 的 人 加 发 展 更 人 使 有 领域 都 受到 大 数据 时 代 的 影响 ,面临 转型 升级 的 所 
我 条 进入 了 大 数据 时 代 。 关 于 大 数据 的 定义 往往 根据 。 切 天 要 。 光 其 站 对 于 以 数 反 和 信 岂 汶 研 究 对 旬 的 知识 
ee 管理 方向 来 说 ,如 何 高 效 便捷 地 发 现 新 知识 .提供 新 产 
(全 巡 度 (dlcity) 大 吉美 (uiety) 于 将 大 数据 癌 “ 他 洁 新 价值 ,从 而 提升 企业 主体 和 社会 组 织 的 竞争 

din as 能 力 ,引起 了 国内 外 学 者 的 广泛 关注 和 高 度 重视 。 

为 海量 ,高 增长 率 9 信息 资产 。 此 后 ,不 
为 使 海量 碎片 数据 的 信息 价值 能 够 得 到 充分 使 
同 煞 者 在 “数据 量 大 " 这 一 特征 的 基础 上 ,从 时 间 、 本 
问 和 多样 性 3 个 方面 前 述 了 大 数据 的 内 洱 与 外 延 , 增 0 bal nana de 
加 了 真实 性 (veracity ) 维度 ,将 数据 质量 纳入 4V 的 范 人 
畴 , 刘 智 慧 凹 在 浙江 大 学 学 报 上 对 大 数据 技术 的 相 AAA ,但 
研究 进行 了 综述 ,并 对 大 数据 的 4V 特征 进行 了 全 面 系 ”未 能 深 人 挖掘 大 数据 时 代 的 特征 内 涵 , 也 有 学 者 对 大 


全 


坟 


了 际 


洲 过 


统 的 阐述 。 大 数据 的 4V 特征 一 经 提出 ,被 学 术 界 普遍 ”数据 时 代 的 技术 工具 进行 梳理 和 介绍 ,如 孟 小 峰 等 、 
接受 ,并 在 社会 上 获得 了 广泛 认可 。IBM 公司 结合 大 ， 许 立波 等 ” ,但 没有 结合 大 数据 技术 工具 的 使 用 ,提出 
数据 的 市 场 应 用 ,在 原 有 框架 内 为 大 数据 增加 了 价值 ”变革 性 、 创 新 性 的 知识 管理 模型 。 此 外 , 现 有 研究 涉及 
(value) 属性 ,继而 从 价值 流转 的 角度 ,发 展 出 连通 性 的 大 数据 时 代 知 识 管理 的 主体 ,多 为 图 书馆 档案 馆 等 
(valence) 与 可 变性 (variability ) ,将 大 数据 的 特征 由 4V 传统 知识 服务 机 构 , 如 刘 洁 玉 ”、 刘 捷 ” 、 曾 润 喜 等 ， 
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对 于 大 数据 发 展 所 种 来 的 决策 支持 功能 和 知识 增值 过 
程 则 研究 不 足 。 为 此 ,本 文 在 梳理 “数据 - 信息 - 知 
识 " 形 成 过 程 的 基础 上 ,分析 了 由 传统 知识 管理 向 大 数 
据 知识 管理 的 转变 ,结合 大 数据 的 4V 特征 介绍 大 数据 
时 代 的 知识 管理 工具 及 知识 管理 方式 ,构建 基于 大 数 


据 背景 的 新 的 知识 管理 模型 ,并 从 数据 碎片 整合 .信息 
安全 保障 ,决策 支持 辅助 .硬件 设施 支撑 4 个 方面 提出 
相应 的 对 策 措 施 ,从 而 在 大 数据 环境 下 更 好 地 实现 知 
识 管理 的 目的 , 即 通过 知识 管理 提高 组 织 的 竞争 能 
与 创新 能 力 ,进而 推动 社会 化 生产 效率 的 提升 。 


2 大 数据 背景 下 知识 管理 过 程 分 析 

对 于 数据 与 知识 的 关系 ,P，Cooper” 认 为 在 特定 
环境 中 数据 的 描述 含义 构成 了 信息 ,而 对 这 些 信息 进 
行 一 构 化 和 组 织 化 则 形成 了 知识 ,可 以 说 ,数据 是 一 种 
基础 信息 ,而 信息 经 过 处 理 提炼 可 构成 知识 。 在 大 数 
据 芹 景 下 ,大 量 的 碎片 化 的 原始 数据 是 分 散 而 孤立 的 ， 
线 洒 处 理 与 解释 ,使 数据 之 间 建 立 了 关联 .形成 了 信 
各, 面 信息 经 过 加 工 与 分 析 转 化 为 知识 ,并 应 用 于 生产 
4 一。 数据 与 信息 的 围 积 是 没有 意义 的 ,只 有 通过 数 
据 悦 掘 与 知识 管理 ,使 得 数据 信息 服务 于 经 济 社会 发 
要 > 才能 发 挥 出 大 数据 的 真正 价值 。 赵 医 英 等 中 认为 ， 
所 漳 知 识 即 是 对 数据 和 信息 进行 提取 ,整合 与 固化 的 


结果 ,并 指出 在 大 数据 的 4V 特征 下 ,需要 对 数量 巨大 、 
来 源 广泛 .格式 多 样 的 数据 集合 进行 采集 、 存 储 与 挖 
掘 , 应 注重 提炼 数据 价值 ,实现 数据 -信息 - 知识 - 智 
慧 的 转变 。 

结合 上 述 学 者 的 研究 梳理 可 知 ,在 大 数据 背景 下 ， 
不 同 渠道 产生 的 大 量 碎片 数据 经 过 提取 清洗、 转换 ， 
进入 数据 仓库 形成 特定 数据 集合 ,再 将 多 个 数据 集合 
通过 线 上 网 络 相 联 ,构建 多 维 数据 立方 体 ,进行 动态 分 
析 并 整合 集成 为 信息 资源 ,通过 描述 性 分 析 与 预测 性 
分 析 ,挖掘 信 息 模 式 及 洪 藏 规律 ,归纳 概括 为 隐 性 知 
识 , 最 后 通过 可 视 化 将 这 些 知识 显 性 化 ,以 直观 的 可 视 
化 画像 呈现 出 来 ,并 由 知识 间 的 关联 性 形成 知识 图 谱 。 
由 此 推导 知识 的 形成 过 程 如 图 1 所 示 , 从 数据 向 知识 
的 转变 ,历经 了 数据 仓库 联机 分 析 、\ 信 息 挖 据 、 知 识 呈 
现 4 个 过 程 ,伴随 着 数据 流 、 信 息 流 .知识 流 、 价 值 流 的 
形成 。 所 有 数据 信息 知识 的 价值 ,最 终 通过 显 性 化 
表达 的 知识 图 谱 得 以 实现 。 此 外 ,考虑 到 大 数据 时 代 
海量 数据 的 交 义 融合 ,使 得 知识 的 形成 过 程 不 是 数据 
到 知识 的 一 对 一 关系 ,而 是 多 对 多 的 形成 过 程 ,因而 在 
知识 图 谱 的 构建 过 程 中 ,也 存在 相应 的 数据 网 、 信 息 
网 .知识 网 和 价值 网 。 


数据 流 的 形成 


信息 流 的 形成 


1 知识 的 形成 过 程 


知识 管理 是 企业 (或 其 他 机 构 ) 对 内 部 知识 资产 
进行 的 管理 ,其 核心 任务 是 将 显 性 知识 与 隐 性 知识 相 
互 整合 ,通过 知识 获取 、 吸 收 、 转 移 等 过 程 ,实现 企业 
(或 其 他 机 构 ) 的 知识 创新 与 价值 创造 。 为 此 ,日 本 学 
者 时 中 郁 次 郎 等 ”提出 了 SECI 模型 ,认为 隐 性 知识 经 
由 社会 化 (socialization ) 、 外 在 化 (externalization) 组合 
化 (combination) 内 隐 化 (internalization )4 个 过 程 , 完 
成 了 知识 管理 的 螺旋 式 上 升 。 知 识 管理 的 关键 在 于 知 
识 转移 ,众多 学 者 从 增加 知识 转 出 方 转移 意愿 .增强 知 


知识 流 的 形成 价值 流 的 形成 
识 接收 方 吸 收 能 力 、 适 当 缩短 知识 距离 等 方面 进行 研 


究 ,力争 扩大 知识 搜寻 范围 .优化 知识 编码 方式 ,从 而 
提高 知识 转移 效率 、 提 升 知识 整合 效果 。 

随 着 大 数据 时 代 的 到 来 ,学 者 们 将 对 知识 管理 的 
关注 焦点 ,由 隐 性 知识 向 显 性 知识 的 转化 ,迁移 到 如 何 
从 海量 多 源 异 构 的 数据 中 挖 气 知识 价值 ,为 此 ,国内 外 
学 者 围绕 大 数据 在 知识 管理 中 的 理论 发 展 及 技术 应 
用 ,展开 了 一 系列 研究 。 在 理论 研究 方面 , A. Simonet 
等 '" 基于 大 数据 增 量 的 敏捷 性 ,引入 了 活性 知识 的 概 
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念 ,认为 大 数据 的 灵活 性 能 够 有 效 提 高 知识 管理 的 表 
2 能 力 ; 秦 殿 启 将 大 数据 理念 运用 于 知识 整合 理 

从 ,基于 个 人 组 织 的 层面 ,论述 了 知识 管理 的 模式 \ 特 
Ps 在 应 用 人 研究 方面 ,C. S. MA | 阐述 


tt 


了 如 何 利 用 大 数据 环境 下 的 移动 智能 终端 平台 , 挖 气 
数据 中 的 有 效 信息 ,并 进行 知识 管 . 黄 天 恩 等 ” 设 
计 了 基于 大 数据 的 仿真 模型 ,运用 知识 管理 的 方法 进 


行 电网 超前 预警 ,解决 了 能 源 互 联网 环境 下 的 安全 一 
体 化 问题 ; 何 军 "9 基于 大 数据 背景 下 决策 环境 的 变 
化 ,系统 阐述 了 大 数据 对 企业 知识 管理 和 战略 决策 的 
影响 。 

学 者 们 普遍 认为 ,大 数据 环境 下 的 知识 管理 需要 
快速 处 理 更 大 体 量 的 数据 集 ,并 以 更 优化 的 知识 管理 
方法 挖掘 海量 低 密 数据 的 知识 价值 。 叶 英 平等 "5 研 
究 邓 基于 网 络 柑 入 的 知识 管 理 模 型 。 与 传统 的 知识 管 
更 研究 相 比 ,大 数据 在 知识 获取 、 知 识 存储 、 知 识 整合 、 
知名 使 用 等 知识 管理 过 程 均 有 所 不 同 : 四 知识 获取 由 
传记 知识 管理 面向 组 织 外 部 的 定向 搜寻 和 主动 获取 ， 
转变 为 海量 碎片 化 数据 的 涌现 ,扩大 了 知识 获取 的 范 
围 称 体 量 , 改 变 了 知识 获取 的 方向 ;@) 知 识 存储 由 私有 
库存 储 的 方式 向 共享 分 布 式 存储 的 方式 转变 ,这 
各 全 滑 存 储 的 方式 ,扩展 了 知识 存储 容量 ,突破 了 知识 
雁 久 所 有 权力 的 限制 ; 国 知识 整合 由 传统 知识 管理 中 

结 椅 化 .可 编码 的 数据 整合 ,向 结构 化 . 半 结 构 化 、 非 结 
梅 俐 并 存 的 多 源 异 构 数据 的 逻辑 整合 转变 , 增 大 了 知 
识 纲 合 的 难度 ,优化 了 知识 整合 的 方式 ;@ 知 识 使 用 的 
关键 前 提 条 件 由 隐 性 知识 的 显 性 化 ,转变 为 数据 清洗 
与 虹 据 脱 敏 , 大 数据 时 代 的 信息 共享 使 得 对 于 数据 处 
理 结果 的 应 用 ,由 服务 于 某 一 主体 的 知识 增值 ,到 被 多 
方 主体 使 用 。 根 据 传统 知识 管理 向 大 数据 背景 下 知识 
管理 的 转变 ,可 以 概括 出 大 数据 背景 下 的 知识 管理 过 
程 如 图 2 所 示 , 即 随 着 时 间 推 移 , 逐 渐 深 化 知识 的 加 工 
程度 ,通过 海量 碎片 数据 的 收集 完成 知识 获取 ,以 分 布 
式 方式 存储 知识 ,通过 处 理 多 源 异 构 数 据 完成 知识 整 
合 ,最 终 将 数据 分 析 结果 应 用 于 商业 价值 的 实现 。 


3 ”大 数据 背景 下 知识 管 
不 同 于 传统 知识 管 


理 技术 工具 

理 过 程 ,大 数据 背景 下 的 知识 
管理 需要 借助 更 多 高 科技 工具 与 软件 ,各 类 大 数据 实 
用 技术 的 使 用 推进 了 知识 管理 过 程 的 变革 ,进而 推 升 
了 知识 管理 水 平和 组 织 运行 效率 。 和 孟 小 峰 " 在 研究 大 
数据 时 代 计 算 机 技术 发 展 的 同时 ,介绍 了 诸多 大 数据 


大 数据 背景 下 


_ 知识 管理 


-一 商业 价值 实现 


深 阶 口 蔷 


知识 使 


7 多 源 异 攀 
IT 
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知识 获取 | 私有 知识 库 “一 一 


定向 搜寻 > 


时 间 推 移 


图 2 知识 管理 过 程 


处 理工 具 , 包 括 用 户 生 成 内 容 、 感 知 式 系统 、 流 处 理 与 
分 处 理 模式 、 人 机 交互 技术 、Caffeine 索引 、Pregel 图 计 
算 模型 等 。 根 据 大 数据 数量 庞大 、 动 态 增长 、 Ge 
构 .价值 低 密 的 4V 特征 ,大 量 迅速 增加 的 数据 集合 

要 借助 数据 清洗 工具 实现 知识 获取 ;海量 ei 
非 结 构 化 的 数据 ,需要 借助 数据 仓库 工具 实现 知识 存 
储 ; 纷 繁复 杂 而 又 质量 参差 的 数据 ,需要 借助 云 计 算 工 
有 具 实现 知识 整合 ;动态 增加 的 原生 数据 ,需要 借助 可 视 
化 工具 进行 数据 挖掘 ,从 而 提炼 知识 价值 并 被 使 用 。 
据 此 ,知识 获取 、 知 识 存储 、 知 识 整合 和 知识 使 用 4 个 
知识 管理 过 程 中 所 涉及 的 数据 清洗 .数据 存储 数据 分 
析 和 数据 挖掘 工具 如 图 3 所 示 : 


数据 清洗 可 视 呈 现 
ETL 工 具 Rshiny 


体 量 大 大 数据 
VOLOME | 4v 特征 


多 样 化 | 整合 
VARIETY 
dA 
云端 分 布 Ce 
、SCM 设备 Hadoop 


a 
图 3 知识 管理 的 技术 工具 


3.1 数据 清洗 技术 及 工具 

大 数据 的 庞大 体 量 并 未 增加 数据 价值 ,反而 意味 
着 数据 噪音 的 增多 和 信息 垃圾 的 泛滥 ,因此 ,在 获取 海 
量 数据 之 后 ,首先 要 进行 数据 清洗 这 一 预 处 理工 作 , 将 
非 清 洁 数 据 降 品 转化 为 高 质量 的 干净 数据 ,从 而 更 好 
地 进行 后 续 数据 分 析 与 知识 管理 。 这 种 数据 的 非 清 洁 
性 一 方面 体现 为 数据 本 身 的 不 准确 .不 完整 , 男 一 方面 
体现 为 数据 之 间 的 宛 余 和 不 一 致 。 彭 宇 等 "认为 数 
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据 清洗 是 指 对 所 需 数据 源 进行 抽取 集成 ,并 从 中 提取 
关系 实体 ,关联 聚合 后 统一 定义 结构 的 过 程 , 旨 在 提高 
数据 质量 ,为 数据 分 析 打 好 基础 。 程 学 旗 等 也 指 
出 ,数据 清洗 是 数据 分 析 的 前 提 , 包括 基于 物化 或 
ETL、 基 于 联邦 数据 库 或 中 间 件 、 基 于 数据 流 、 基 于 搜 
索引 擎 四 种 方法 。 大 数据 时 代 细微 有 用 的 信息 混杂 在 
庞大 的 数据 量 中 ,因而 数据 清洗 过 程 需要 在 质 与 量 之 
间 进 行 权衡 ,粒度 过 细 可 能 会 过 滤 掉 有 用 信息 ,而 粒度 
过 粗 又 无 法 达到 清洗 效果 。 借 助 ETL( extraction ,trans- 
formation ,load) 工具 ,可 以 通过 提取 -转换 - 负载 的 过 
程 ,将 来 自 不 同 运行 平台 、 编 制 语言 ,物理 位 置 的 数据 
按照 统一 格式 提取 出 来 ,再 进行 清洗 转换、 集成 ,加 载 
进入 数据 仓库 。 
3 闻 - 云端 分 布 技术 及 工具 
三 大 数据 的 出 现 对 于 数据 存储 的 颠 柳 不 是 简单 的 技 
进 和 空间 扩容 问题 ,小 到 数据 来 源 、 大 到 数据 思 
维 S 部 为 数据 存储 带 来 革命 性 变化 。 由 于 存储 空间 的 
需 丝 量 巨 大 ,需要 采用 云端 分 布 的 数据 仓库 进行 数据 
存储 。 大 数据 的 动态 增长 对 于 数据 仓库 响应 时 间 的 要 
求 淆 出 了 考验 ,区 别 于 传统 知识 管理 中 静态 关系 数据 
甘 念 ,数据 仓库 还 涉及 了 决策 支持 系统 中 大 数据 
的 动态 存 取 问 题 , 需 要 在 数据 仓库 中 对 大 数据 进行 数 
撕 如 理 。 爹 汶 清 等 将 传统 数据 库 与 新 兴 数据 存储 
技术 进行 了 对 比 ,认为 在 存储 基础 上 ,数据 仓库 还 具备 
阔 锯 处 理 功能 ,具体 划分 为 流 处 理 模式 与 批 处 理 模型 
两 午 方 式 。 其 中 , 流 处 理 更 多 依赖 于 内 存 中 的 概要 数 
据 结构 即 内 存 容 量 ,需要 借助 PCM( 相 变 存储 器 ) 等 储 
存 统 内 存 (SCM) 设备 ,如 推 特 公 司 的 Storm ,雅虎 公司 
的 S4 以 及 领 英 公司 的 Kafka 等 ;而 批 处 理 模式 的 代表 
则 是 谷歌 公司 的 Map Reduce 编程 模型 ,通过 将 数据 源 
进行 分 块 , 交 给 不 同 的 Map 任务 区 ,把 解析 出 的 链 / 值 
(key/value) 对 集合 执行 Map 函数 ,将 得 到 的 中 间 结 
写 人 本 地 硬盘 ,再 由 Reduce 任务 根据 key 值 进行 排 
序 ,并 输出 最 终结 果 。 
3.3 ”联机 处 理 技术 及 工具 

印 东 "" 从 统计 学 的 角度 ,分 析 了 大 数据 环境 对 数 
据 处 理 提出 的 挑战 。 而 联机 处 理 为 大 数据 提供 了 弹性 
扩展 .成 本 较 低 .模式 丰富 .资源 庞大 的 计算 能 力 ,可 以 
同时 处 理 结构 化 , 半 结构 化 , 非 结构 化 等 形式 的 异 构 系 
统 ,通过 网 络 将 计算 能 力 组 织 起 来 ,实现 数据 处 理 的 规 
模 化 和 专业 化 。 随 着 4G 网 络 的 兴起 和 移动 终端 的 使 
用 ,还 衍生 出 移动 云端 联机 处 理 的 概念 ,将 网 络 中 的 存 
储 数据 借 由 应 用 软件 集合 起 来 ,协同 计算 ,从 而 为 知识 


发 现 打下 基础 。 联 机 处 理工 具 如 谷歌 公司 开发 的 Ha- 
doop ,是 一 个 能 够 对 大 量 数据 进行 云 计算 的 软件 框架 ， 
作为 目前 最 为 流行 的 云 计算 开源 平台 , 文 撑 了 谷歌 公 
司 内 部 的 大 数据 处 理 与 知识 管理 应 用 ;又 如 微软 公司 
使 用 Dryad 模型 构建 的 支持 有 向 无 环 图 ( DAU ) 类 型 数 
据 流 的 并 行程 序 ,通过 联机 处 理 过 程 可 实现 提炼 数据 
价值 的 目的 。 
3.4 ”可 视 呈 现 技术 及 工具 

可 视 化 技术 是 数据 挖掘 和 知识 发 现 的 必要 手段 ， 
是 促进 知识 传播 和 转化 的 重要 工具 ,也 是 知识 管理 系 
统 的 重要 技术 基础 。 通 过 可 视 化 技术 ,丰富 了 知识 的 
表现 形式 ,降低 了 知识 的 理解 吸收 难度 ,激发 了 人 们 接 
受 和 学 习 知 识 的 意愿 ,促进 了 知识 在 组 织 内 外 的 传播 
共享 。 任 大 等 ”认为 可 视 分 析 以 总 结 性 表达 的 方式 ， 
更 好 地 实现 了 对 知识 库 的 调用 与 掌控 ,有 利于 知识 的 
更 新 迭代 ,并 在 研究 中 介绍 了 常见 的 可 视 化 技术 ,包括 
标签 云 .历史 流 、 空 间 信息 流 等 ,以 及 Rshiny Flot、 
Raphael .Google Charts 、SAS Visual Analytics 等 可 视 化 
软件 。 在 实际 应 用 中 ,可 以 根据 数据 挖掘 与 知识 发 现 
的 需要 ,选择 合适 的 可 视 化 技术 和 可 视 化 程序 ,并 通过 
可 视 化 ,实现 数据 价值 的 使 用 。 官 思 发 等 ”指出 , 联 
机 处 理 过 程 和 可 视 化 呈现 对 于 数据 本 身 的 真实 性 要 求 
较 高 ,只 有 相对 准确 、 可 以 信赖 的 高 质量 数据 ,其 计算 
处 理 与 可 视 分 析 的 结果 才 具 有 意义 与 价值 ,如 果 数 据 
本 吴 存 在 错误 或 问题 , 那 数据 分 析 和 数据 挖掘 的 结果 
也 不 会 是 正确 的 。 同 时 ,可 视 化 技术 还 需要 借助 元 数 
据 的 管理 ,元 数据 是 关于 数据 的 数据 ,体现 了 数据 之 间 
的 关联 关系 以 及 数据 本 身 的 固有 属性 ,元 数据 的 表征 
有 利于 对 数据 进行 可 视 化 呈现 展示 。 

4 大 数据 时 代 知 识 管理 模型 构建 

在 大 数据 时 代 , 数 据 从 传统 知识 管理 的 处 理 对 象 ， 
转变 为 知识 管理 的 基础 资源 ,这 些 实时 动态 数据 、 非 结 
构 化 数据 乃至 机 器 生成 数据 ,造成 了 数据 庞大 体 量 的 
规模 性 和 多 源 异 构 的 复杂 性 ,并 为 传统 知识 管理 的 知 
识 存储 与 知识 整合 带 来 了 挑战 。 大 数据 环境 下 的 知识 
管理 ,体现 了 知识 量 激增 、 知 识 处 理 速度 快 . 知 识 更 加 
多 样 化 .知识 价值 密度 降低 而 知识 价值 总 量 增 加 、 知 识 
处 理 更 加 信息 化 和 智能 化 等 特点 。 数 据 量 的 增长 并 非 
将 知识 管理 系统 简单 扩容 就 能 解决 ,量变 引起 质变 , 传 
统 的 知识 管理 理念 和 技术 已 经 无 法 应 对 海量 的 大 数据 
时 代 , 知 识 管理 系统 的 更 新 速度 与 处 理 速度 已 经 超过 
了 传统 知识 管理 的 提速 方式 和 人 逻辑 负 丛 ,需要 以 新 兴 
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的 大 数据 技术 重 塑 知识 管理 流程 ,以 创新 的 知识 管理 
方式 规整 碎片 化 大 数据 。 

借鉴 传统 知识 管理 中 知识 获取 、 知 识 存储 、 知 识 整 
合 知识 使 用 的 过 程 ,大 数据 的 知识 管理 可 划分 为 知识 
生产 \ 知 识 积累 、 知 识 交 流 和 知识 应 用 4 个 阶段 ,并 形 
成 知识 反馈 。 其 中 ,知识 生产 阶段 包括 知识 发 现 环 诈 
和 知识 采集 环节 ,知识 积累 阶段 包括 知识 存储 环节 和 
知识 检索 环节 ,知识 交流 阶段 包括 知识 分 享 环节 和 知 
识 更 新 环节 ,知识 应 用 阶段 包括 知识 测评 环节 和 知识 
服务 环节 , 共 8 个 环节 。 对 于 知识 检索 、 知 识 搜 寻 、 知 
识 吸收 、 知 识 转移 、 知识 忘记 等 环节 , 亦 可 归纳 概括 到 
上 述 4 个 阶段 过 程 模型 中 。 

传统 知识 管理 过 程 是 以 知识 搜寻 为 起 点 ,以 提升 
创新 能 力 为 目标 的 组 织 学 习 过 程 ,而 大 数据 时 代 的 知 
展 , 由 于 数据 特征 的 变 


化 和 技术 手段 的 变革 ,呈现 出 差异 性 与 复杂 化 。 参 考 
赵 获 英 等 ”、 孟 小 峰 等 ”、 许 立波 等 ”、 叶 英 平等 ”的 
研究 ,结合 大 数据 背景 下 知识 管理 技术 工具 的 使 用 ,本 
研究 旨 在 大 数据 背景 下 ,构建 具有 普遍 适应 性 的 知识 
管理 模型 ( 见 图 4) 。 结 合 大 数据 环境 分 析 具 体 的 知识 
管理 过 程 ,从 海量 数据 中 提炼 信息 ,发 现 知识 、 提 供 行 
为 决策 依据 ,最 终 实现 商业 利润 与 经 济 效益 。 同 时 ,分 
析 大 数据 特征 为 各 个 阶段 的 知识 管理 活动 带 来 的 挑 
战 。 值 得 注意 的 是 ,有 些 组 织 的 知识 管理 过 程 可 能 呈 
现 出 跳跃 式 发 展 ,路过 了 其 中 的 部 分 阶段 ;而 有 些 组 织 


的 知识 管理 过 程 可 能 会 出 现 反复 式 发 展 , 在 其 中 部 分 
阶段 循环 进行 ,但 大 部 分 组 织 的 知识 管理 过 程 ,仍然 遵 
循 图 4 所 示 的 知识 管理 模型 的 规律 。 为 将 知识 管理 模 
型 与 实际 案例 相 联 系 ,以 如 何 提 高 百度 知识 搜索 效率 
及 精准 度 为 例 , 对 知识 管理 模型 加 以 阐述 。 
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© 图 4 知识 管理 模型 构建 


4.1 知识 生产 阶段 

传统 知识 管理 的 首要 任务 是 知识 搜寻 ,只 有 获取 
了 一 定量 的 知识 ,才能 对 这 些 知识 进行 后 续 的 整合 与 
吸收 ,而 在 海量 碎片 化 信息 的 大 数据 时 代 , 数 据 可 以 来 
源 于 互联 网 , 物 联网 以 及 大 量 移 动 智能 终端 设备 ,知识 
获取 的 难度 不 在 于 信息 搜寻 ,而 在 于 如 何 从 庞杂 的 数 
据 中 通过 知识 发 现 完成 知识 采集 ,如 语义 多 样 性 即 为 
百度 搜索 提出 了 这 样 的 挑战 。 对 于 同样 的 知识 信息 ， 
其 对 应 的 数据 形式 却 未 必 一 致 ,同时 ,在 不 同 的 语义 情 
境 下 ,相同 的 词句 也 可 能 表达 不 同 的 含义 。 为 此 ,百度 
平台 与 其 他 搜索 引擎 相互 合作 ,扩大 了 数据 搜寻 范 
同时 ,通过 正则 表达 式 的 方式 ,将 输入 数据 格式 进行 规 
范 化 处 理 , 并 将 数据 转化 为 信息 ,进而 提炼 、 生 产 对 应 
的 知识 ,并 将 客户 每 次 搜索 点 击 的 路 径 生 成 衍生 数据 。 
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“元 数据 ”的 反馈 


由 于 数据 量 大 造成 低 密 特征 ,为 避免 知识 被 淹没 在 大 
数据 中 ,需要 借助 降 品 手段 使 大 数据 缩水 ,从 而 在 数据 
海洋 中 发 现 和 采集 更 多 知识 。 在 知识 生产 阶段 ,通过 
知识 发 现 和 知识 采集 ,可 以 结合 大 数据 技术 对 市 场 进 
行 扫描 与 监测 ,识别 客户 需求 及 潜在 客户 ,获得 更 多 客 
户 知识 资源 。 
4.2 知识 积累 阶段 

知识 生产 阶段 产 出 的 知识 是 分 散 零碎 的 ,少量 知 
识 不 足以 支撑 产品 创新 与 技术 进步 ,因而 需要 将 这 些 
知识 积累 在 知识 仓库 中 。 经 过 清洗 降 噪 预 处 理 过 程 的 
知识 在 进入 仓库 后 ,可 实现 知识 存储 和 知识 检索 功能 。 
然而 ,先后 进入 仓库 的 知识 往往 会 相互 关联 和 连接 ,并 
且 这 种 相关 性 或 连接 性 会 随 着 知识 积累 的 增多 而 越 来 
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越 密切 ,导致 知识 之 间 的 关系 越 来 越 复 杂 , 为 后 续 群 体 
事件 预测 .关系 变化 建 模 等 造成 困扰 。 为 此 ,百度 搜索 
词 条 在 知识 积累 的 过 程 中 对 知识 价值 进行 提纯 ,并 建 
立 知 识 间 的 关联 性 ,运用 知识 图 谱 的 方式 ,从 海量 数据 
库 中 为 客户 提供 精准 推送 。 区 别 于 传统 知识 管理 中 的 
静态 知识 库 ,知识 仓库 的 存储 具有 动态 变化 的 特征 ,以 
此 提升 知识 的 实时 索引 能 力 。 在 知识 积累 阶段 ,通过 
不 断 积 揽 客 户 知识 及 市 场 知 识 ,与 组 织 原 有 知识 储备 
形成 互补 性 资源 ,能 够 有 效 弥补 组 织 的 知识 短缺 ,使 知 
识 体系 更 加 完善 。 
4.3 ”知识 交流 阶段 

当面 临 知识 交流 需求 时 ,可 将 知识 仓库 中 的 知识 
进行 分 享 ,但 出 于 对 知识 源 的 产权 保护 以 及 对 知识 开 
发 的 多 重 可 能 ,需要 建立 知识 交换 平台 ,将 脱 敏 后 的 知 
识 枉 独立 的 交换 空间 内 进行 分 享 , 并 根据 所 分 享 的 新 


知 轴 ,补充 ,更 新 原 有 的 知识 体系 。 为 提供 给 客户 个 性 
伐 陷 搜索 服务 ,百度 公司 将 使 用 同一 耳 地 址 及 同一 合 
瑞 户 的 多 个 终端 设备 的 数据 信息 进行 关联 存储 ,并 
与 度 备 在 其 他 平台 的 浏览 记录 与 交易 信息 进行 共享 存 
储 稻 交 又 分析。 在 知识 交流 阶段 ,通过 知识 分 享 能 

实现 组 织 的 知识 创新 ,对 于 共享 知识 ,做 到 有 则 更 新 、 
危 册 创新 ,将 新 知识 与 原 有 知识 相互 融合 ,并 与 组 织 饼 
沈 际 经 营 情况 相 联系 ,切实 推进 组 织 产 品 .服务 .经 营 
模式 等 方面 的 知识 创新 。 
42K 知识 应 用 阶段 

它 在 知识 应 用 阶段 ,基于 大 数据 情境 的 知识 测评 不 
同 生 传统 商业 调研 ,能 够 以 知识 分 析 和 知识 挖掘 的 方 
式 6 为 组 织 提供 全 面 .客观 .详细 的 测评 结果 ,辅助 组 织 
管理 者 做 出 正确 的 战略 决策 。 此 外 ,基于 知识 评价 数 
据 , 可 以 对 知识 价值 和 知识 关系 做 出 测评 ,从 而 筛选 出 
无 用 ,重复 .过 时 的 知识 ,构建 有 序 的 知识 网 络 ;也 可 基 
于 知识 测评 服务 ,为 客户 提供 知识 产品 和 决策 咨询 , 即 
实现 对 外 知识 服务 的 目的 。 如 百度 公司 根据 索引 的 点 
击 量 对 词 条 进行 竞争 性 排序 。 在 组 织 完成 知识 生产 、 
知识 积累 .知识 交流 、 知 识 应 用 4 个 知识 管理 过 程 后 ， 
对 知识 应 用 的 评价 数据 会 在 知识 发 现 与 知识 采集 的 环 
节 重新 被 捕获 ,从 而 形成 知识 反馈 ,使 知识 在 反复 循环 
的 过 程 中 实现 螺旋 式 上 升 的 增值 过 程 。 在 组 织 进行 决 
策 行为 与 经 营 活动 的 过 程 中 ,会 产生 关联 数据 与 行为 
数据 (这 些 关 于 数据 的 数据 统称 为 "元 数据 "” ) ,这 些 
元 数据 会 伴随 着 大 数据 洪流 重新 涌 向 组 织 ,同时 也 而 
向 所 有 互联 网 主体 开放 ,伴随 知识 发 现 与 知识 采集 , 反 
复 循 环 参与 到 知识 管理 的 各 个 阶段 。 通 过 知识 管理 的 
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反馈 过 程 ,能 够 实现 有 针对 性 的 精准 推送 ,以 智能 化 的 
方式 分 析 客 户 行为 数据 ,挖掘 客户 需求 规律 ,提供 个 性 
产品 推荐 及 服务 信息 匹配 ,向 客户 传递 所 需 产 品 及 知 
识 , 从 而 增加 客户 对 产品 或 服务 的 认 知 和 需求 ,获得 超 
额 商 业 利润 。 可 以 说 ,从 大 数据 到 知识 管理 ,既是 逐步 
提升 的 螺旋 上 升 结构 ,也 是 循环 往复 的 转换 过 程 。 


5 大 数据 时 代 知 识 管理 对 策 


大 数据 时 代 的 知识 管理 是 借助 数据 分 析 和 数据 挖 
掘 的 技术 手段 ,将 大 量 碎片 化 数据 转化 为 有 价值 的 知 
识 ,并 为 社会 经 济 发 展 提供 知识 服务 的 过 程 。 可 见 , 原 
始 数据 技术 平台 ,应 用 价值 是 实现 大 数据 时 代 知 识 管 
理 的 3 个 关键 要 素 , 此 外 ,为 保障 知识 管理 的 有 序 进 
行 , 信 息 安 全 问题 也 同样 值得 关注 。 为 解决 上 述 问 题 ， 
需 提 出 大 数据 时 代 知 识 管理 的 相关 对 策 。 

5.1 原始 数据 的 碎片 整合 问题 及 对 策 

大 数据 时 代 的 海量 碎片 数据 将 信息 分 割 为 非 连续 
的 无 逻辑 的 零碎 单元 ,而 这 些 多 源 异 构 的 数据 信息 推 
动 了 当代 知识 传播 在 思维 .表达 内 容 以 及 主体 等 方面 
的 碎片 化 。 任 福 兵 ” 和 张 文 德 等 ”都 曾 指出 , 宛 杂 信 
息 的 存在 使 得 在 知识 管理 过 程 中 ,知识 获取 的 时 间 维 
度 和 空间 维度 具有 随机 性 与 不 确定 性 , 即 知识 获取 与 
传送 在 零碎 的 时 间 和 多 变 的 空间 内 完成 。 同 时 ,数据 
的 快速 产生 与 更 新 也 对 知识 管理 的 时 效 性 和 应 激 性 提 
出 了 更 高 的 要 求 。 为 应 对 大 数据 时 代 的 知识 管理 , 需 
要 组 织 具有 更 高 的 变革 思维 ,适时 变化 的 沟通 能 力 ,分 
析 能 力 和 决策 能 力 , 有 助 于 适应 “碎片 化 ”环境 ,更 好 
地 发 挥 知 识 管理 的 作用 。 大 数据 时 代 的 知识 传播 形式 
向 “ 言 简 意趣 ”的 方向 转变 ,这 些 用 户 生成 内 容 对 于 相 
似 观 点 的 表达 却 广泛 而 杂碎 ,因而 使 得 碎片 化 信息 的 
获取 更 加 复杂 耗 时 ,而 知识 的 整合 涉及 多 个 类 型 不同 
领域 之 间 的 交叉 碎片 信息 。 为 此 ,通过 知识 仓库 的 建 
立 , 能 够 快速 \ 完 整地 得 到 海量 关联 数据 ,将 大 数据 下 
元 杂 的 碎片 化 信息 进行 整理 ,建立 系统 性 的 分 析 原 则 ， 
构建 所 需 知识 框架 ,构造 人 机 交互 平台 。 通 过 系统 化 、 
结构 化 的 知识 库 形成 统一 碎片 化 处 理 规则 ,增添 访问 
功能 的 查询 模块 ,设置 用 户 需 求 权 限 , 从 而 提高 碎片 数 
据 的 获取 速度 .提升 信息 整合 的 精准 程度 。 

5.2 决策 辅助 的 应 用 价值 问题 及 对 策 

知识 管理 的 目的 在 于 知识 服务 ,大 数据 背景 下 的 
知识 管理 不 仅仅 局 限于 对 历史 经 验 的 梳理 ,更 重要 的 
是 能 够 通过 海量 数据 建立 足够 大 的 样本 库 ,涵盖 生产 
生活 的 各 个 领域 。 基 于 马尔 可 夫 链 的 计算 ,能 够 推测 
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某 一 事件 的 发 生 概率 ,并 推演 未 来 发 展 的 最 可 能 方向 ， 
这 种 基于 大 数据 分 析 的 信息 预测 是 客观 科学 的 ,并 且 
随 着 机 器 学 习 的 深度 发 展 ,其 预测 的 准确 率 将 不 断 提 
升 。 大 数据 背景 下 的 知识 管理 正在 逐渐 摆脱 信息 不 完 
全 的 束缚 ,因此 可 以 应 用 于 组 织 决策 辅助 领域 ,为 客户 
提供 决策 支持 服务 。 郭 申 铜 等 ”将 数据 挖掘 引入 了 
电子 健康 服务 及 医疗 诊断 决策 辅助 , 胡 小 荣 等 ”将 数 
据 分 析 应 用 于 上 市 公司 的 风险 识别 与 决策 辅助 ,B，Gnu 
等 5 将 数据 驱动 应 用 于 客户 满意 度 评价 ,以 替代 传统 
的 问卷 调查 和 客户 回访 。 知 识 管理 能 够 辅助 决策 , 相 
应 地 ,决策 辅助 系统 也 能 应 用 于 组 织 知识 管理 行为 的 
改进 。 
5.3 ”技术 平台 的 硬件 支撑 问题 及 对 策 
一 伴随 着 互联 网 的 发 展 ,更 多 软件 工具 被 应 用 于 知 
识 管理 过 程 ,如 微软 的 One Note 笔记 本 等 知识 管理 软 
件 台 及 Service Hot 等 知识 管理 系统 。 相 比 之 下 ,学 术 
国产 业界 对 知识 管理 的 硬件 支持 设施 关注 度 较 低 ， 
知 届 管理 的 硬件 系统 基础 设施 建设 也 相对 不 足 。 知 识 
管理 平台 是 由 专家 系统 .知识 库 等 技术 工具 构成 的 综 
公约 统 ,与 支持 知识 收集 ,加 工 \ 存 储 、 传 递 和 利用 的 各 
征 基 础 设施 构成 ,能 够 快速 分 析 知识 结构 ,共享 知识 、 
对 开头 的 知识 内 容 分 门 别 类 处 理 。 在 构造 知识 管理 平 
从 的 过 程 中 ,仅仅 依靠 先进 的 数据 分 析 与 知识 管理 软 
件 是 不 够 的 ,基础 设施 同样 至 关 重要 。 存 储 设备 如 果 
提早 ,会 造成 平台 信息 的 丢失 和 泄露 ;处 理 器 的 故障 则 
会 造成 系统 运行 的 瘫痪 ;在 联机 处 理 过 程 中 ,运行 速度 
较 局 的 设备 需要 花费 时 间 等 待 其 他 设备 的 延迟 反映 ， 
造 碟 了 运算 能 力 及 能 源 消耗 的 浪费 ,诸如 此 类 洪 藏 的 
经 济 损失 不 可 估量 。 因 此 ,为 促进 大 数据 背景 下 知识 
管理 能 力 的 提升 ,需要 引进 与 软件 相 匹配 ,高 效 的 基础 
硬件 设施 ,并 及 时 对 硬件 设备 进行 更 新 与 维护 工作 , 制 
定 突 发 事件 应 急 措施 , 当 出 现 危 机 情形 时 ,确保 设备 的 
基本 运转 以 保障 数据 和 信息 的 安全 。 
5.4 ”信息 安全 的 隐私 伦理 问题 及 对 策 

大 数据 在 对 社会 发 展 以 及 人 类 生活 产生 巨大 改变 
的 同时 ,也 带 来 了 不 可 忽视 的 数据 隐私 问题 和 信息 安 
全 风险 。 黄 国彬 等 ”认为 隐私 泄露 的 风险 是 由 不 同 
数据 来 源 之 间 的 组 合 .多 种 渠道 信息 的 又 加 ,增加 了 对 
用 户 身份 信息 特征 的 推断 概率 ; 王 世 伟 2 也 认为 大 数 
据 分 析 技术 如 聚 类 .情感 分 析 的 广泛 应 用 ,正在 逐渐 获 
取 用 户 的 个 人 特征 ,窥视 用 户 的 私人 生活 ,而 这 些 用 户 
隐私 信息 的 泄露 可 能 会 带 来 误导 ,诈骗 等 社会 问题 , 影 
响 社会 稳定 。 大 数据 背景 下 的 知识 内 容 是 庞杂 的 ,很 


多 时 候 获 取 的 信息 并 不 能 实现 完整 的 利用 ,因此 ,在 实 
际 操作 中 ,只 获取 学 术 研 究 与 产业 发 展 所 需要 的 数据 
言 息 成 为 破解 隐私 保护 问题 的 关键 。 在 数据 清洗 与 脱 
敏 阶段 ,需要 全 面 分 析 需 求 目标 与 预期 结果 ,规划 获取 
言 息 的 规模 、 结 构 和 层次 等 要 素 ; 在 获取 或 者 交换 信息 
时 ,精准 对 接 所 需 的 数据 结构 ,扩大 有 效 信息 占 比 。 此 
外 ,仍然 需要 采取 一 定 技术 手段 保护 信息 安全 ,如 防火 
墙 技术 以 及 匿名 保护 技术 的 使 用 ,能 够 有 效 监管 与 检 
测 恶意 信息 获取 行为 ,维护 数据 安全 ;同时 ,隐藏 用 户 
的 身份 信息 以 及 行为 特征 ,提高 用 户 隐私 保护 的 意识 
行为 。 


大 数据 时 代 的 到 来 意味 着 更 加 精准 的 知识 管理 与 
更 加 智能 的 知识 服务 ,也 为 知识 管理 带 来 诸多 机 遇 :( 
知识 管理 的 系统 化 ,由 机 器 自动 搜集 的 海量 数据 和 传 
统 人 工 进行 的 知识 搜寻 相 比 ,虽然 其 价值 密度 有 所 降 
低 , 但 因数 据 的 信息 量 呈 几何 增长 ,所 蕴含 的 价值 总 量 
仍然 非常 巨大 , 且 价 值 体系 更 加 丰富 与 完整 ;@ 知 识 管 
理 的 智能 化 ,结合 机 器 学 习 的 智慧 发 展 ,能 够 将 人 类 从 
知识 管理 的 中 低 端 解放 出 来 ,专注 于 高 级 知识 的 生产 
和 应 用 ;@) 知 识 管理 的 科学 化 ,组 织 依靠 大 数据 分 析 进 
行 的 运营 决策 更 加 客观 和 准确 ,通过 数据 挖掘 还 可 以 
辅助 组 织 预 测 未 来 发 展 方向 ,从 而 做 出 更 加 科学 的 战 
略 规划 。 

大 数据 在 提供 种 种 机 遇 的 同时 ,也 逐渐 暴露 出 一 
些 可 能 的 危害 ,为 知识 管理 带 来 挑战 :中 数据 安全 问 
题 ,海量 数据 的 开放 会 带 来 数据 泄露 和 隐私 安全 的 挑 
战 , 但 信息 过 度 罕 化 又 会 影响 数据 分 析 的 准确 性 ,如 何 
在 数据 清洗 和 数据 脱 敏 的 过 程 中 兼顾 数据 安全 与 数据 
价值 ,平衡 数据 公开 与 隐私 保护 的 关系 ,是 知识 管理 需 
要 关注 的 问题 ;@@ 大 量 异 构 数 据 的 处 理 问题 ,知识 管理 
需要 应 对 数据 量 的 多 样 化 爆炸 式 增长 ,尤其 是 图 像 视 
频 等 格式 的 非 结构 化 信息 的 大 量 涌现 ,对 数据 的 存储 
与 处 理 币 来 了 挑战 ,如 何以 大 数据 思维 重 构 组 织 业 务 
流程 ,提高 数据 分 析 的 准确 性 与 及 时 性 ,是 知识 管理 需 
要 解决 的 问题 ;@) 硬 件 基 础 问题 ,日 益 复 杂 的 硬件 环境 
及 其 异 构 性 导致 在 联机 处 理 的 过 程 中 ,大 量 时 间 浪 费 
在 等 待 性 能 较 差 的 服务 器 做 出 计算 ,这 种 木 桶 效应 为 
大 数据 的 基础 设施 建设 带 来 挑战 ,如 何 提 高 硬件 集群 
的 整体 性 能 ,是 知识 管理 需要 重视 的 问题 。 

随 着 数据 量 的 不 断 增 大 ,数据 中 心 的 存储 规模 也 
在 不 断 扩张 ,高 耗 能 将 逐渐 成 为 制约 大 数据 发 展 的 瓶 
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人 颈 因 素 ,如 何在 优化 知识 管理 ,提升 知识 服务 的 同时 ， 
降低 大 数据 分 析 处 理 的 能 源 消耗 ,是 未 来 需要 破解 的 
资源 难题 。 然 而 这 方面 尚未 引起 社会 的 足够 重视 , 国 
内 外 相关 学 者 往往 更 关注 大 数据 的 实践 应 用 研究 , 因 
此 ,将 大 数据 与 其 他 技术 融合 发 展 ,提高 知识 资源 的 生 
产 与 供给 能 力 ,同时 ,将 大 数据 技术 与 小 样本 分 析 结 合 
使 用 ,也 是 大 数据 思维 与 大 数据 产业 的 重要 融合 手段 。 
大 数据 并 不 是 一 个 充斥 着 算法 和 机 器 的 冰冷 世界 , 通 
过 强化 知识 管理 和 知识 服务 意识 ,期 待 知识 型 社会 走 
进 全 民 大 数据 时 代 。 
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了 Knowledge Management Process Technical Tools, Models and Strategies in the Period of the Big Data 


Ye Yingping Chen Haitao 


Chen Hao 


Management School of Jilin University, Changchun 130022 


Abstract: [ Purpose/significance | The period of big data has brought changes to traditional knowledge manage- 


ment. In order to adapt to the coming of the big data, it is necessary to re-understand the process of knowledge manage- 


ment, and use technology tools to build new knowledge management models to overcome the challenge of knowledge man- 


agement. [Method/process | After the summarization of the formation process of data to knowledge, together with 4V fea- 
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tures of big data, and the analysis of big data technology tools needed for knowledge management, the knowledge manage- 
ment in the period of big data is divided into four stages: knowledge production, knowledge accumulation, knowledge ex- 
change and knowledge application. With the help of technology tools, a new model of knowledge management is built. So- 
lutions are proposed to the problems such as debris consolidation, application value, hardware support, and ethics on pri- 
vacy. [ Result/conclusion | Big data promote the development of the transformation of the knowledge management process 
from the traditional model. The model of knowledge management in the period of big data is closely related to the use of 
technology tools. It emphasizes the value of knowledge extracted from mass fragmentation data and more effectively assists 
organizational decision making. Therefore, hardware support, information security, and combining big data technology 
with small sample analysis will push knowledge management to a new level. 


Keywords: period of big data technical tool knowledge management model 
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